Obiettivi di Apprendimento
- Identificare i componenti principali di un kernel CUDA utilizzando il modificatore __global__
- Implementare l'allocazione della memoria sul dispositivo e il trasferimento dei dati tra Host e Device
- Calcolare gli indici dei thread globali per mappare gli elementi dei dati a singoli thread GPU
- Eseguire e sincronizzare l'avvio parallelo di un kernel utilizzando configurazioni di griglia e blocchi